🦊Ace-Step 1.5
👈 |
👉 |
参考
モデルのダウンロード
diffusion mosels
text encoders
vae
code:models
📂ComfyUI/
└── 📂models/
├── 📂diffusion_models/
│ └── acestep_v1.5_turbo.safetensors
├── 📂text_encoders/
│ ├── qwen_0.6b_ace15.safetensors
│ ├── qwen_1.7b_ace15.safetensors
│ └── qwen_4b_ace15.safetensors
└── 📂vae/
└── ace_1.5_vae.safetensors
text2music
https://gyazo.com/30868d074e0f22908d76f42632489a60
0.6Bはテキストエンコーダとして常時読み込む
1.7Bや4Bがあったときは、audio_codes(メタ情報から変換される高レベル表現)の生成にそれらを使う
出力(例)
https://scrapbox.io/files/6982c9f8abe2856fd413eecf.mp3